ইলাস্টিকসার্চ (ElasticSearch)

Common Ingest Processors এবং তাদের ব্যবহার

Latest Technologies - ইলাস্টিকসার্চ (ElasticSearch) - Elasticsearch Ingest এবং Pipelines | NCTB BOOK

Common Ingest Processors এবং তাদের ব্যবহার

Elasticsearch-এ Ingest Processors হলো সেই উপাদান, যা Ingest Pipelines-এর মাধ্যমে ডেটাকে ইন্ডেক্স করার আগে প্রিপ্রোসেস বা এনরিচ করে। প্রতিটি প্রসেসর একটি নির্দিষ্ট কার্য সম্পাদন করে, যেমন ডেটা ট্রান্সফরমেশন, ফিল্ড পরিবর্তন, ভ্যালিডেশন, বা অতিরিক্ত তথ্য যোগ করা। Elasticsearch-এ অনেক ধরনের Ingest Processor রয়েছে, যা ডেটা ইন্ডেক্স করার আগে বিভিন্ন প্রক্রিয়া প্রয়োগ করতে ব্যবহার করা যায়। নিচে কিছু সাধারণ Ingest Processor এবং তাদের ব্যবহার নিয়ে আলোচনা করা হলো:

১. Set Processor

Set Processor একটি নির্দিষ্ট ফিল্ডে একটি মান সেট করে। এটি ডেটা প্রসেসিং-এর সময় নতুন ফিল্ড তৈরি করতে বা বিদ্যমান ফিল্ড আপডেট করতে ব্যবহৃত হয়।

সাধারণত ডেটা প্রসেসিং টাইমস্ট্যাম্প, স্ট্যাটিক ভ্যালু, বা কাস্টম মান সেট করতে এটি ব্যবহৃত হয়।

উদাহরণ:

{
 "set": {
   "field": "processed_at",
   "value": "{{_ingest.timestamp}}"
 }
}
  • এখানে "processed_at" ফিল্ডে ইনজেস্ট টাইমসট্যাম্প সেট করা হয়েছে, যা ডকুমেন্ট প্রসেসিং-এর সময় নির্ধারণ করে।

২. Rename Processor

Rename Processor একটি ফিল্ডের নাম পরিবর্তন করে। এটি এমন ক্ষেত্রে ব্যবহৃত হয়, যেখানে ডেটার ফিল্ডের নাম পরিবর্তন করতে হয়, যাতে তা আরও বর্ণনামূলক বা সামঞ্জস্যপূর্ণ হয়।

উদাহরণ:

{
 "rename": {
   "field": "user_ip",
   "target_field": "client_ip"
 }
}
  • এখানে "user_ip" ফিল্ডকে "client_ip" নামে পরিবর্তন করা হয়েছে।

৩. Remove Processor

Remove Processor একটি নির্দিষ্ট ফিল্ড মুছে ফেলে। এটি অপ্রয়োজনীয় বা সংবেদনশীল ডেটা বাদ দেওয়ার জন্য ব্যবহৃত হয়।

উদাহরণ:

{
 "remove": {
   "field": "temporary_info"
 }
}
  • এখানে "temporary_info" ফিল্ডটি মুছে ফেলা হয়েছে।

৪. Convert Processor

Convert Processor একটি ফিল্ডের ডেটা টাইপ পরিবর্তন করে। এটি সাধারণত ডেটার ফরম্যাটিং বা টাইপ পরিবর্তন করতে ব্যবহৃত হয়, যেমন string থেকে integer বা boolean

উদাহরণ:

{
 "convert": {
   "field": "age",
   "type": "integer",
   "ignore_missing": true
 }
}
  • এখানে "age" ফিল্ডের ডেটা টাইপ integer এ পরিবর্তন করা হয়েছে।

৫. Date Processor

Date Processor একটি নির্দিষ্ট ফিল্ডের তারিখের ফরম্যাট নির্ধারণ বা পরিবর্তন করে। এটি বিভিন্ন তারিখ ফরম্যাটকে স্ট্যান্ডার্ড ফরম্যাটে রূপান্তর করতে ব্যবহৃত হয়।

উদাহরণ:

{
 "date": {
   "field": "log_date",
   "formats": ["MM/dd/yyyy HH:mm:ss"],
   "target_field": "formatted_date",
   "output_format": "yyyy-MM-dd"
 }
}
  • এখানে "log_date" ফিল্ডের তারিখ "yyyy-MM-dd" ফরম্যাটে রূপান্তর করে "formatted_date" ফিল্ডে সংরক্ষণ করা হয়েছে।

৬. Grok Processor

Grok Processor একটি প্যাটার্ন ব্যবহার করে টেক্সট থেকে ডেটা এক্সট্রাক্ট করে। এটি লগ বা টেক্সট ডেটার উপর ভিত্তি করে তথ্য বের করতে এবং আলাদা ফিল্ডে সংরক্ষণ করতে ব্যবহৃত হয়।

উদাহরণ:

{
 "grok": {
   "field": "message",
   "patterns": ["%{IP:client_ip} - - \\[%{HTTPDATE:timestamp}\\] \"%{WORD:method} %{URIPATHPARAM:request} HTTP/%{NUMBER:http_version}\" %{NUMBER:status} %{NUMBER:bytes}"]
 }
}
  • এখানে "message" ফিল্ড থেকে IP ঠিকানা, তারিখ, এবং HTTP পদ্ধতির মতো তথ্য এক্সট্রাক্ট করা হয়েছে।

৭. GeoIP Processor

GeoIP Processor একটি IP ঠিকানা থেকে ভৌগোলিক তথ্য বের করে। এটি IP-এর ভিত্তিতে দেশ, শহর, এবং লোকেশন পয়েন্টের মতো অতিরিক্ত তথ্য যোগ করতে ব্যবহৃত হয়।

উদাহরণ:

{
 "geoip": {
   "field": "client_ip",
   "target_field": "geoip"
 }
}
  • এখানে "client_ip" ফিল্ড থেকে ভৌগোলিক তথ্য বের করে "geoip" নামে একটি ফিল্ডে সংরক্ষণ করা হয়েছে।

৮. Uppercase/Lowercase Processor

Uppercase এবং Lowercase Processor ফিল্ডের মানকে বড় অক্ষর (Uppercase) বা ছোট অক্ষর (Lowercase) এ রূপান্তর করে। এটি স্ট্রিং ডেটাকে নির্দিষ্ট ফরম্যাটে স্টোর করতে ব্যবহৃত হয়।

উদাহরণ:

{
 "uppercase": {
   "field": "username"
 }
}
  • এখানে "username" ফিল্ডের মানকে বড় অক্ষরে রূপান্তর করা হয়েছে।

৯. Script Processor

Script Processor একটি কাস্টম স্ক্রিপ্ট ব্যবহার করে ডেটার উপর কাস্টম প্রসেসিং চালায়। এটি জটিল ট্রান্সফরমেশন বা লজিক প্রয়োগের ক্ষেত্রে ব্যবহৃত হয়।

উদাহরণ:

{
 "script": {
   "source": "ctx.new_field = ctx.existing_field * 2"
 }
}
  • এখানে "existing_field" এর মানকে দ্বিগুণ করে "new_field" নামে একটি নতুন ফিল্ডে সংরক্ষণ করা হয়েছে।

১০. Pipeline Processor

Pipeline Processor একটি পাইপলাইনের ভেতর আরেকটি পাইপলাইন কল করতে ব্যবহৃত হয়। এটি Nested Pipelines তৈরি করতে এবং জটিল ডেটা প্রসেসিং পরিচালনা করতে সহায়ক।

উদাহরণ:


{
 "pipeline": {
   "name": "child_pipeline"
 }
}

Content added By
Promotion